import pandas as pd
import os

# 2.1的简单版（源文件更改）
# 去重，去除文件中存在另一个文件中存在企业名称，并删除整行内容

# 文件夹2
name='测试'
# 目标是文件夹时使用
# file_path1 = f'./data/{name}/base'
company_names = set()
# for file in os.listdir(file_path1):
#     file_path11 = os.path.join(file_path1, file)
#     df = pd.read_excel(file_path11)
#     company_names.update(df[0].tolist())
# print(company_names)
# 文件
file_path2 = f'./data/{name}/过滤文件.xlsx'
df2 = pd.read_excel(file_path2)
company_names.update(df2['企业名称'].tolist())
print(company_names)



# 文件1
file_path1 = f'./data/{name}/base'
for file_name in os.listdir(file_path1):
    file_name1 = os.path.join(file_path1, file_name)
    df1 = pd.read_excel(file_name1)
    file_df1 = df1[~df1[0].isin(company_names)]

    file_df1.to_excel(file_name1, index=False)





